На страницу 2 семестра

Матрицы весов аминокислотных замен

Множественное выравнивание блока из базы данных BLOCKS, отвечающего белку SODF_ECOLI

Изображение множественного выравнивания блока IPB001189C

                                                                                                                                         
                                            *                 2 0                   *                 4 0                   *            
O 0 2 6 1 6 | 9 8     :   E I N A S F G S F A K F K E E F T N V A V G H F G C G L A W P V K D T N S G K L K V Y Q T H D A G C P   :   5 1
O 1 5 6 4 0 | 9 8     :   A I V D S F G T F A S F K K E F T D A P N G H F G S G W A W L V K D K S S G K L K V L Q T H D A G C P   :   5 1
O 1 5 6 4 1 | 1 2 9   :   A I A N E F G S V D D F T V S F Q Q A G V N N F G S G W T W L C V D P R T K E L R I D N T S N A G C P   :   5 1
O 1 5 9 0 4 | 9 6     :   K I E E K F G S F S A F K T D F S N L L A G H F G S G W G W L V L K D D G T A D I V Q T H D A G S P L   :   5 1
O 3 4 0 2 9 | 6 9     :   A I N A K W G S F D A F K E A F T K A A V G T F G S G W A W L V K K A D G S L D I V S T S N A A T P L   :   5 1
O 4 2 9 1 9 | 1 4 3   :   A V N E N F G S K E N L L S K I H E L A S N S F G A C W L W I V I D D Y N R L N L L R T F Q A G S P Y   :   5 1
O 4 3 9 5 7 | 9 4     :   L L K K N F G S V E K F Q E T F T A K A S T V F G S G W A Y L Y K T K D G K L E I G Q Y S N A A N P V   :   5 1
O 5 0 2 5 7 | 9 7     :   A L K A S F G S V E A C M E Q L S E A A K T Q F A S G W A W L A K G T E N G K P V L K V M K T G N A D   :   5 1
O 6 5 3 2 4 | 1 2 8   :   A I D T S F G S L E G L V K K M S A E G A A V Q G S G W V W L G L D K E L K K L V V D T T A N Q D P L   :   5 1
O 6 5 3 2 7 | 1 0 9   :   L L E R D F T S Y E K F Y D E F N A A A A T Q F G A G W A W L A Y A D N K L K V V K T P N A V N P L V   :   5 1
O 7 4 2 0 0 | 1 2 4   :   A I K K E W K S V D E F I R I F N M Q L A G I Q G S G W A W L V K S P F S Q R L S I Q I T M N Q D V V   :   5 1
O 7 4 3 7 9 | 1 0 5   :   G I D A S F G S F G E L K S Q M V D V G N S V F G D G W L W L V Y S P E K S L F S L L C T Y N A S N A   :   5 1
O 7 7 0 7 1 | 9 9     :   E I K K E F T S V E N F K D E F S K V A A G H F G S G W A W L V W D K Q G K K V G I E Q T H D A G T P   :   5 1
O 8 1 2 3 3 | 9 5     :   A I D T H F G S L E S L I Q K M N A E G A A L Q G S G W V W L G V N K E L K K L V I E T T P N Q D P L   :   5 1
O 8 1 2 4 0 | 1 4 9   :   Q I D K D F G S F T N F R E K F T N A A L T Q F G S G W V W L V L K R E E R R L E V V K T S N A I N P   :   5 1
O 8 2 5 1 9 | 8 4     :   A I D M H F G S F E A L L Q K M N A E G A A L Q G S G W V W L G L D K E L K R L V V E T T A N Q D P L   :   5 1
O 8 2 5 7 1 | 1 2 1   :   W A I D E D F G S I E K L I K K M N A E G A L Q G S G W V W L A L D K E A K G L S V E T T P N Q D P L   :   5 1
O 8 2 5 8 3 | 1 4 4   :   L I E R D F G S F E G M M A Q F K N A A L T Q F G S G W A W L V Y K A N R L D V G N A V N P C P T E K   :   5 1
O 8 2 5 8 4 | 1 3 7   :   A I D T D L G S F E A L I Q K I S A E G A A L Q G S G W V W L A L D K E L K K V T V E T T A N Q D P L   :   5 1
O 8 4 9 2 4 | 1 0 4   :   A I E E T F G S F E D F K E E F K T A A T G R F G S G W A W L V V K D G K L A I T S T A N Q D S P L M   :   5 1
O 8 6 1 6 8 | 1 0 4   :   E I N S V F G S F D K F K E Q F A A A A A G R F G S G W A W L V V N N G K L E I T S T P N Q D S P L S   :   5 1
P 7 9 0 2 2 | 1 2 8   :   R I V E Q Y G S L D N L K A I T N G K L A G I Q G S G W A F I V K N K E N G G A L D V I T T A N Q D T   :   5 1
P 9 3 6 0 6 | 1 2 8   :   A I D E D F G S I E K L I K K M N A E G A A L Q G S G W V W L A L D K E A K K L S V E T T P N Q D P L   :   5 1
P 9 6 2 0 1 | 1 2 9   :   A I D R D F G S F E E F K E K F K Q C G I S T F G S G W A W L V S D K D G K L E I M S T K D Q S S P I   :   5 1
Q 2 7 7 4 0 | 9 6     :   K I Q E D F G S F N N F K E Q F S N I L C G H F G S G W G W L A L N N N N K L V I L Q T H D A G N P I   :   5 1
Q 2 7 7 9 1 | 9 8     :   E I N A S F G S F A K F K E E F T N V A V G H F G S G L A W L V K D T N S G K L K V Y Q T H D A G C P   :   5 1
Q 4 2 6 7 2 | 1 2 4   :   E I D N H F G S L D A L I Q K M S A E G A A V Q G S G W V W L G L D K E L K H L V V E T T P N Q D P L   :   5 1
Q 4 2 6 8 3 | 1 3 3   :   A I T R D F G S L D K F K E E F K Q A G M T Q F G S G W A W L N A D K T G K L S I S K S P N A V N P V   :   5 1
Q 4 3 1 2 1 | 1 2 8   :   A I D E D F G S F E A L V K K M S A E G A A L Q G S G W V W L A L D K E A K K L S V E T T A N Q D P L   :   5 1
Q 4 3 2 7 3 | 1 3 2   :   A I D E D F G S F E A L V K K M N A E G A A F Q G S G W V W L A L D K E A K K V S V E T T A N Q D P L   :   5 1
Q 4 3 8 0 3 | 1 2 8   :   A I D E D F G S F E A L V K K M S A E G A A L Q G S G W V W L A L D K E A K K L S V E T T A N Q D P L   :   5 1
Q 5 9 1 3 3 | 1 0 2   :   A I V R D F G S V E A F Q A E F E K A A A T R F G S G W A W L V V E G G K L A V V S T A N Q D N P I M   :   5 1
Q 5 9 1 6 5 | 7 2     :   A I K D S F G S F E K F Q A Q F T A T A L G I Q G S G W A V L A Y D S I S G K L L I F Q L F D Q Q A N   :   5 1
Q 5 9 2 2 5 | 1 0 3   :   A I D R D L G G M E K F Q T D F N A A G G R V F G S G W V F V T V T K D G K L A I E T R P N Q D N P I   :   5 1
Q 5 9 3 0 7 | 7 2     :   A I D R D F G S F E K F K A H F S A A A L G L Q G S G W A V L G Y D H I A G R L L V E Q L T D Q Q G N   :   5 1
Q 5 9 4 9 6 | 7 2     :   A I D D A F G S F D K F R A Q F S A A A N G L Q G S G W A V L G Y D T L G S R L L T F Q L Y D Q R A N   :   5 1
Q 5 9 5 1 8 | 7 2     :   A I D D Q F G S F D K F Q A Q F T A A A N G L Q G S G W A V L G Y D S L G D R L L T F Q L Y D Q Q A N   :   5 1
Q 5 9 5 2 2 | 7 2     :   A I D D Q F G S F D K F Q A Q F S A A A N G L Q G S G W A V L G Y D T L G G R L L T F Q L Y D Q Q A N   :   5 1
Q 5 9 5 6 2 | 7 2     :   A I D D A F G S F D K F R A Q F S A A A N G L Q G S G W A V L G Y D T R G D R L L T F Q L Y D Q Q A N   :   5 1
Q 5 9 5 8 8 | 7 2     :   A I D D A F G S F D K F R A Q F T A A A T T V Q G S G W A A L G W D S L G G K L L V F Q V Y D H Q S N   :   5 1
Q 5 9 6 7 3 | 1 0 0   :   A I D E F F G S F D N M K A Q F T A A A T G I Q G S G W A S L V W D P L G K R I N T L Q F Y D H Q N N   :   5 1
Q 5 W D 5 2 | 1 0 6   :   A I D Q A F G S F E G F K E T F T K A A T T R F G S G W A W L V V N E S K E L E V Y S T A N Q D N P I   :   5 1
Q 5 W H 0 1 | 1 8 1   :   R I T E D F G S F Q K M K A H F S N A A E K V E G G G W A M L I Y A P R S H R L E I L Q A E K H Q N L   :   5 1
Q 5 W H A 5 | 1 0 4   :   D I K S T F G S V E E F K N K F A D A A K G R F G S G W A W L V V N N G N L E I T S T P N Q D T P L S   :   5 1
Q 5 W S I 1 | 9 6     :   A I N K N F G S F A A F K E Q F S Q T A A T T F G S G W A W L V Q D Q S G A L K I I S T S N A G T P M   :   5 1
Q 5 X 0 Q 7 | 9 6     :   A I N K S F G S F A A F K E Q F S Q T A A T T F G S G W A W L V Q D Q S G A L K I I S T S N A G T P M   :   5 1
Q 5 X B F 8 | 1 0 2   :   A I D D A F G S F D A F K E Q F T A A A T G R F G S G W A W L V V N K E G Q L E I T S T A N Q D T P I   :   5 1
Q 5 X L 6 4 | 9 4     :   A L E K D F G S L E K F K E D F I K S A T T L F G S G W N W A A Y N L D T Q K I E I I Q T S N A Q T P   :   5 1
Q 5 X L 6 6 | 9 4     :   A L E K D F G S L E K F K E D F I K S A T T L F G S G W N W A A Y N L D T Q K I E I I Q T S N A Q T P   :   5 1
Q 5 X L 6 8 | 9 4     :   A L E K D F G S L E K F K E D F I K S A T T L F G S G W N W A A Y N L D T Q K I E I I Q T S N A Q T P   :   5 1
Q 5 X L 6 9 | 9 4     :   A L E K D F G S L E K F K E D F I K S A T T L F G S G W N W A A Y N L D T Q K I E I I Q T S N A Q T P   :   5 1
Q 5 X L 7 0 | 9 4     :   A L E K D F G S L E K F K E D F I K S A T T L F G S G W N W A A Y N L D T Q K I E I I Q T S N A Q T P   :   5 1
Q 5 X L 7 4 | 9 4     :   A L E K D F G S L E K F K E D F I K S A T T L F G S G W N W A A Y N L D T Q K I E I I Q T S N A Q T P   :   5 1
Q 5 X L 7 5 | 9 4     :   A L E K D F G S L E K F K E G F I K S A T T L F G S G W N W A A Y N L D T Q K I E I I Q T S N A Q T P   :   5 1
Q 5 X L 7 6 | 9 4     :   A L E K D F G S L E K F K E D F I K S A T T L F G S G W N W A A Y N L D T Q K I E I I Q T S N A Q T P   :   5 1
Q 5 X L 7 7 | 9 4     :   A L E K D F G S L E K F K E D F I K S A T T L F G S G W N W A A Y N L D T Q K I E I I Q T S N A Q T P   :   5 1
Q 5 X L 7 9 | 9 4     :   A L E K D F G S L E K F K E D F I K S A T T L F G S G W N W A T Y N L D T Q K I E I I Q T S N A Q T P   :   5 1
Q 5 X N P 4 | 1 1 8   :   L L E R D F H G L E N F K K E M K A A A V A V Q G S G W A W L G Y N Q K T K A L Q V A A C P N Q D P L   :   5 1
Q 5 Y B Y 1 | 1 3 4   :   A I D E S F G S L G E F Q S K M N A A L A G I Q G S G W A W L V K D K Q T G N I G I K T Y A N Q D P V   :   5 1
Q 5 Z 3 M 8 | 9 8     :   A I D D Q F G S F D K F R A Q F T A A A N G L Q G S G W A V L G Y D T L G Q K L L T F Q L Y D Q Q A N   :   5 1
Q 5 Z R B 5 | 1 0 0   :   A I N K S F G S F A A F K E Q F S Q T A A T T F G S G W A W L V Q D Q S G A L K I I N T S N A G T P M   :   5 1
Q 6 0 4 S 8 | 9 7     :   A I V K S F G S F E K F K E A F T Q C A V T T F G S G W A W L V K N A D G S L A L V S T S N A G C P L   :   5 1
Q 6 0 6 F 0 | 1 1 4   :   K I E A S F G S V A A C K K E F A S A A V S Q F G S G W A W L V L D G D K L E I I R T A N A D I P L T   :   5 1
Q 6 1 C X 1 | 1 1 9   :   M I K R D F G D L S T L Q K M L S A S T I A V Q G S G W G W L G Y C P K G K K L K L A T C A N Q D P L   :   5 1
Q 6 1 I Y 8 | 5 1 4   :   E I E K K Q E A L A T E K N D I N A A A T L L K K R K P A E L E R K V D R K R P Q A V S I Q I Q N D S   :   5 1
Q 6 2 H I 6 | 1 2 5   :   A I N A K W G S F D A F K E A F T K A A V G T F G S G W A W L V K K A D G S L D I V S T S N A A T P L   :   5 1
Q 6 3 0 F 7 | 1 0 5   :   V I D Y Y F N T F D N L K D Q L S K A A I S R F G S G Y G W L V L D G E E L S V M S T P N Q D T P L Q   :   5 1
Q 6 3 4 R 2 | 1 0 5   :   A I E A K F G S F D A F K E E F A K A G A T R F G S G W A W L V V N N G E L E V T S T P N Q D S P L T   :   5 1
Q 6 3 D R 3 | 1 9 7   :   R I E Q D F G S F L R F Q K H F T E A A S K V E G S G W A I L V W V P R S G R L E I L Q S T L H Q L F   :   5 1
Q 6 3 W L 1 | 9 6     :   A I N A K W G S F D A F K E A F T K A A V G T F G S G W A W L V K K A D G S L D I V S T S N A A T P L   :   5 1
Q 6 4 F K 6 | 1 1 7   :   A I K R D F G S F D K F K E K L T A V S V G V Q G S G W G W L G F N K E R G C L Q I A A C S N Q D P L   :   5 1
Q 6 5 H B 3 | 1 0 4   :   A I N S K F G S F D Q F K E D F A A A A A G R F G S G W A W L V V N N G E L E I T S T P N Q D S P L S   :   5 1
Q 6 5 I H 9 | 1 7 4   :   M I N R S F G S Y S A F K E H F S E A A K K V E G V G W A I L V W A P R S H R L E I L I A E K H Q L M   :   5 1
Q 6 5 V L 4 | 1 0 9   :   A I I R D F G S V E A F Q A E F E K A A A T R F G S G W A W L V V Q E G G K L A V V S T A N Q D S P I   :   5 1
Q 6 5 Y 0 2 | 1 1 4   :   A V E K D F G S W D N I K N Q L S T A S V A V Q G S G W G W L G Y N K Q M K K L Q I A T C Q N Q D P L   :   5 1
Q 6 6 2 L 2 | 1 0 3   :   D V N T A F G S P D V L K A S L K D T A M K I F G S G W A W L V L C P D S G L K V I S M P N Q D S P L   :   5 1
Q 6 6 3 U 9 | 1 0 2   :   A I E R D F G S V D S F K E K F E Q A A A T R F G S G W A W L V L K D D G K L A V V S T A N Q D S P L   :   5 1
Q 6 6 A 3 3 | 9 6     :   A I N K S F G S F A E F K A Q F T D A A V K N F G A G W T W L V K K A D G T L A I V S T S N A G T P L   :   5 1
Q 6 6 S 0 6 | 1 7 0   :   Q I N N D F G S F D A F K K E M C A K S A A V K G S G W G W L G W N K E A S K L Q V A T C Q N Q D P L   :   5 1
Q 6 7 Q L 1 | 1 0 4   :   A I N A A F G S F Q N F K D E F A K A G A G R F G S G W A W L V V T K D G K L A V Y S T A N Q D S P L   :   5 1
Q 6 7 T 0 3 | 2 0 5   :   Q I R Q D F G D F R R F R E Q F S K A A E N V E G G G W A V W V W A P R A N R T E I L T A E K H Q N L   :   5 1
Q 6 8 U U 1 | 1 2 0   :   L I K R D F G S L D A M K D N L F A S T V A V Q G S G W G W L A Y C K N E K K L K V A T C P N Q D P L   :   5 1
Q 6 8 W K 0 | 1 1 2   :   Q I S Q D F G S F E Q F C E Q F K Q E A L G Q F G S G W V W V V Y N N N K L Q I I K T S N A D T P I V   :   5 1
Q 6 9 4 A 3 | 1 1 3   :   A I E E Q F S S F E Q F K K D L S A L S I G V Q G S G W G W L G Y N K K X K K L Q I L A V S N Q E P L   :   5 1
Q 6 A 6 R 9 | 9 9     :   A I D E F F G S F D S F K K Q F E E T A K G V Q G S G W G M L V W D V M G Q R L N T M Q L F D H Q G N   :   5 1
Q 6 A F 4 6 | 9 8     :   A I D E F F G S F D K F R A H F T A S A L G I Q G S G W S I L A W D S L S Q K L I I E Q L Y D H Q A N   :   5 1
Q 6 A R I 0 | 1 0 1   :   K I D A D F G S Y D N F V E Q L K N A G L T Q F G S G W A W L V L N N N K L E I M K T A N A D T P I A   :   5 1
Q 6 B 7 S 8 | 1 1 9   :   A I K R D F G S Y E N F K A R M T V K T V A I Q G S G W G W L G L C P V S K R L Q I V T C A N Q D P L   :   5 1
Q 6 B 7 S 9 | 1 2 0   :   A I N R D F G S F E E F K T Q L S T A T I A I Q G S G W G W L S Y N P V T K R L Q I V T C Q N Q D P L   :   5 1
Q 6 B G Q 8 | 1 2 7   :   L A D Q D F A N I E S F R D H F L L V A D S S F G Q G W V F L V E L P D K S V K I L K C G N D G T P Y   :   5 1
Q 6 B J 6 6 | 1 2 9   :   R I A A Q Y G S I E N L Q S I A N A K L A G I Q G S G W A F L V K N K E N G G S L D V V T T Y N Q D T   :   5 1
Q 6 B R E 3 | 1 5 9   :   W I I N S F G S I A E F R T L L L N S A K G I K G D G L V W L V A Q A T Y S E S T M R N N Q F S S N A   :   5 1
Q 6 C B Q 1 | 1 0 3   :   E I A K Q F G S L D E F K A K L K A D L L A L Q G S G W A W L V S Y P D G T L K I E V T S N Q D A I S   :   5 1
Q 6 C D Z 0 | 1 6 2   :   L I L T S F G T V E A F R E H L L T K A E S I F G N G Y T W L V L S K H S G R L H L V N T Y N N G F I   :   5 1
Q 6 C E C 5 | 1 2 6   :   R L E D K F E S M E R A R E N F L A T A D E M T G N G W V F L Y E G G D K N M Y I S A H H N A G S P F   :   5 1

Степень консервативности изображена в соответствии с 4 уровнями консервативности:

Веса аминокислотных замен

Вычисление весов аминокислотных замен на основе множественного выравнивания блока IPB001189C из базы данных BLOCKS

Пара аминокислот nab pab qa qb sab
L,L 24364 0,02820 0,08376 0,08376 4
L,I 7740 0,01207 0,08376 0,04556 1
L,P 4689 0,00475 0,08376 0,02338 1
В таблице использованы следующие обозначения:

nab — число пар a и b в выравнивании
pab — частота встречаемости пары a и b
qa — частота встречаемости аминокислоты a в парах
qb — частота встречаемости аминокислоты b в парах
sab — вес аминокислотной замены

Вычисление весов аминокислотных замен на основе множественных выравниваний 200 блоков из базы данных BLOCKS

Пара аминокислот nab pab qa qb sab
L,L 1326940 0,02383 0,09045 0,09045 3
L,I 682604 0,01663 0,09045 0,05435 2
L,P 833490 0,00364 0,09045 0,04735 -2
Условные обозначения в таблице — те же, что и в предыдущей.

Сравнение весов аминокислотных замен

Пара аминокислот Блок IPB001189C 200 блоков BLOSUM62
L,L 4 3 4
L,I 1 2 2
L,P 1 -2 -3

    Вес замены лейцина на лейцин достаточно большой, но невелик по сравнению с весами замен других остатков на себя. Это объясняется не только его достаточно незамысловатым радикалом, но и наличием похожей на него аминокисоты изолейцина (именно поэтому S(L,I) необычно высок). А сильно отрицательный вес замены лейцина на пролин объясняется гетероциклом у пролина, делающем структуру этих остатков сильно разными, так что эта замена способна значительно изменить свойства белка.
   Рассчитанные веса замен по 200 блокам выравниваний гораздо ближе к данным blosum62, чем рассчитанные по одному блоку. Это объясняется гораздо большим количеством пар аминокислотных остатков, учитываемых в рассчете вероятностей, поэтому статистика по 200 блокам близка к статистике blosum62. А удивительная схожесть результатов S(L,L) во втором задании с данными blosum62 — это просто совпадение...


© Лев Шагам,2005